#encoding=utf-8
'''
Created on 2011-12-27

@author: ajwang
'''
from Queue import Queue
from threading import Condition, Thread
from urlparse import urlparse
import socket
from const import CONST
from pagelinks import PageLinks
from collections import deque
import time
from urlcontainer import UrlContainer
import random
import glob


socket.setdefaulttimeout(10.0)


class Worker(Thread):
    def __init__(self, tasks, _id):
        Thread.__init__(self)
        self.tasks = tasks
        self.id = _id
        self.daemon = True
        self.start()
    
    def run(self):
        while True:
            str = self.tasks.get()
            print self.id, str, self.tasks.unfinished_tasks
            time.sleep(1)
            self.tasks.task_done()

class ThreadPool:
    def __init__(self, num_threads):
        self.task_num = 0
        self.tasks = Queue(num_threads)
        for _ in range(num_threads): Worker(self.tasks, _)

    def add_task(self, str):
        self.tasks.put(str)

    def wait_completion(self):
        self.tasks.join()
        

def ttt():
    pass


#pool = ThreadPool(10)
#for _ in range(30):
#    pool.add_task(str(_))
#
#pool.wait_completion()

#ret = ['biolab.suda.edu.cn', 'bjwx.suda.edu.cn', 'bkssw.suda.edu.cn', 'bsh.suda.edu.cn', 'bwc.suda.edu.cn', 'call.suda.edu.cn', 'card.suda.edu.cn', 'cete.suda.edu.cn', 'chemistry.suda.edu.cn', 'chemlab.suda.edu.cn', 'ciptlab.suda.edu.cn', 'cjy.suda.edu.cn', 'clgc.suda.edu.cn', 'csxy.suda.edu.cn', 'cwc.suda.edu.cn', 'cxzy.suda.edu.cn', 'dag.suda.edu.cn', 'dangxiao.suda.edu.cn', 'db.suda.edu.cn', 'dfzfyj.suda.edu.cn', 'dgdz.suda.edu.cn', 'dj.suda.edu.cn', 'dsj.suda.edu.cn', 'dwshy.suda.edu.cn', 'dwyst.suda.edu.cn', 'dwzx.suda.edu.cn', 'dzxx.suda.edu.cn', 'emlab.suda.edu.cn', 'energy.suda.edu.cn', 'eng.suda.edu.cn', 'eng1.suda.edu.cn', 'file.suda.edu.cn', 'fineng.suda.edu.cn', 'focus.suda.edu.cn', 'forensic.suda.edu.cn', 'funsom.suda.edu.cn', 'fxcs.suda.edu.cn', 'fygwxy.suda.edu.cn', 'fzb.suda.edu.cn', 'garden.suda.edu.cn', 'ggw.suda.edu.cn', 'gh.suda.edu.cn', 'gwxy.suda.edu.cn', 'hlxy.suda.edu.cn', 'hpc.suda.edu.cn', 'hqglc.suda.edu.cn', 'hysgl.suda.edu.cn', 'ibms.suda.edu.cn', 'ihanyu.suda.edu.cn', 'international.suda.edu.cn', 'jdxy.suda.edu.cn', 'jfjt.suda.edu.cn', 'jgstpf.suda.edu.cn', 'jjs.suda.edu.cn', 'jnp.suda.edu.cn', 'jns.suda.edu.cn', 'jsyb.suda.edu.cn', 'jtxy.suda.edu.cn', 'jwc.suda.edu.cn', 'jxsys.suda.edu.cn', 'jyb.suda.edu.cn', 'jysw.suda.edu.cn', 'jyxy.suda.edu.cn', 'kczx.suda.edu.cn', 'kjlt.suda.edu.cn', 'law.suda.edu.cn', 'lcjn.suda.edu.cn', 'library.suda.edu.cn', 'library1.suda.edu.cn', 'libts.suda.edu.cn', 'lmscosu.suda.edu.cn', 'ltc.suda.edu.cn', 'ltx.suda.edu.cn', 'mail.suda.edu.cn', 'math.suda.edu.cn', 'mec.suda.edu.cn', 'medical.suda.edu.cn', 'mpa.suda.edu.cn', 'msetc.suda.edu.cn', 'museum.suda.edu.cn', 'my.suda.edu.cn', 'myauth.suda.edu.cn', 'nano.suda.edu.cn', 'nanoexp.suda.edu.cn', 'neser.suda.edu.cn', 'net.suda.edu.cn', 'net2.suda.edu.cn', 'neuroscience.suda.edu.cn', 'nlp.suda.edu.cn', 'oversea.suda.edu.cn', 'pac.suda.edu.cn', 'pccsu.suda.edu.cn', 'phyedu.suda.edu.cn', 'phylab.suda.edu.cn', 'physics.suda.edu.cn', 'rsc.suda.edu.cn', 'rss.iboker.com', 'rurc.suda.edu.cn', 'sbc.suda.edu.cn', 'sbcgxt.suda.edu.cn', 'scit.suda.edu.cn', 'scm.suda.edu.cn', 'scst.suda.edu.cn', 'sdbn.suda.edu.cn', 'sdekxy.suda.edu.cn', 'sdgcxl.suda.edu.cn', 'sdkjy.suda.edu.cn', 'sdttc.suda.edu.cn', 'sdtw.suda.edu.cn', 'sdtx.suda.edu.cn', 'sdty.suda.edu.cn', 'sdxyy.suda.edu.cn', 'search.suda.edu.cn', 'sfl.suda.edu.cn', 'shxy.suda.edu.cn', 'sit.suda.edu.cn', 'skc.suda.edu.cn', 'slsj.suda.edu.cn', 'snfz.suda.edu.cn', 'stpf.suda.edu.cn', 'sudabao.suda.edu.cn', 'sxy.suda.edu.cn', 'sysbio.suda.edu.cn', 'szdwwy.suda.edu.cn', 'tangcenter.suda.edu.cn', 'tdh.suda.edu.cn', 'tec.suda.edu.cn', 'texlab.suda.edu.cn', 'textile.suda.edu.cn', 'tjxh.suda.edu.cn', 'toupiao1.suda.edu.cn', 'toupiao2.suda.edu.cn', 'tyxy.suda.edu.cn', 'tzb.suda.edu.cn', 'tzfw.suda.edu.cn', 'uninews.suda.edu.cn', 'vm1.suda.edu.cn', 'webmail.suda.edu.cn', 'wenzheng.suda.edu.cn', 'wg.suda.edu.cn', 'www.suda.edu.cn', 'www.zhhz.suda.edu.cn', 'www2.suda.edu.cn', 'wxy.suda.edu.cn', 'xb.suda.edu.cn', 'xcb.suda.edu.cn', 'xdgx.suda.edu.cn', 'xiaoqing.suda.edu.cn', 'xjgx.suda.edu.cn', 'xjj.suda.edu.cn', 'xjzx.suda.edu.cn', 'xk.suda.edu.cn', 'xk1.suda.edu.cn', 'xlcp.suda.edu.cn', 'xlzx.suda.edu.cn', 'xsc.suda.edu.cn', 'xsh.suda.edu.cn', 'xskx.suda.edu.cn', 'xsst.suda.edu.cn', 'xxzxcs.suda.edu.cn', 'yanhui.suda.edu.cn', 'yingping.suda.edu.cn', 'yjs.suda.edu.cn', 'yjsgl.suda.edu.cn', 'youth.suda.edu.cn', 'ysxy.suda.edu.cn', 'ysxysy.suda.edu.cn', 'yx.suda.edu.cn', 'yxbfzb.suda.edu.cn', 'yxbsyzx.suda.edu.cn', 'yxsyzx.suda.edu.cn', 'yxx.suda.edu.cn', 'zcjygs.suda.edu.cn', 'zhuanti.suda.edu.cn', 'zjc.suda.edu.cn', 'zkzs.suda.edu.cn', 'zsb.suda.edu.cn', 'zxbm.suda.edu.cn', 'zxbx.suda.edu.cn', 'zxyxpt.suda.edu.cn', 'zyz.suda.edu.cn', 'zzb.suda.edu.cn']
#print len (ret)
#ret = []
#for file in glob.glob(CONST.DIR + '*'):
#    arr = file.split('\\')
#    print arr[len(arr) - 1:]
#    ret += ['http://' + arr[len(arr) - 1:][0]]



a = {}
print a.get(None)


s = '中国'
print len(s)

aaa = s.decode('utf-8')
print type(aaa)
print len(aaa)
